查看原文
其他

无参RAD测序与分析流程 | RAD专题

LJC 联川生物 2022-05-21


小编近期将为大家讲解简化基因组测序(Reduced-Representation Genome Sequencing, RRGS)相关知识,包括简化基因组简介,RRGS常用方法介绍,不同RAD技术的比较,无参RAD测序技术的应用,无参RAD测序研究思路与方法及无参RAD测序与分析流程等,每天只需5分钟,轻松学习RRGS相关知识~

话不多说,进入今天的专题——无参RAD测序与分析流程。


1DNA样本提取与质检

建议使用DNA提取试剂盒采用标准流程提取亲本和群体的DNA,如采用传统SDSCTAB法提取的DNA,需对DNA进行抽提,去除蛋白和RNA。样品要求如下:

(1)样品类型:DNA 样品,琼脂糖电泳无降解或轻微降解,无污染,NanoDrop测定DNA浓度,OD260/OD280比值应为1.8~2.0。
(2) 样品需求量(单次):每次样品制备需要1ug 样品,如果需要多次制备样品,则需要样品总量=制备样品次数*1 ug。
(3)样品浓度:≥25 ng/μl,推荐浓度为100~200 ng/μl。
(4)推荐样本大小:子代个体数≥100。


2文库构建与测序

对于没有参考基因组的物种进行简化基因组测序,首先需要选择合适的限制性内切酶对目标基因组进行消化。可参考已发表的文献,或根据与目标物种亲缘关系较近的已测序物种的基因组信息选择内切酶,同时利用选择的内切酶对基因组分别进行酶切预实验,根据酶切实验的结果选择合适的内切酶进行后续实验。建库测序步骤如下:

(1)样品、barcode和接头的准备及干燥;

(2)DNA的消化:采用限制性内切酶或内切酶组合对基因组DNA进行酶切;

(3)在消化后的DNA片段两端加接头(adapter):单酶切RAD一端的接头含有barcode序列,另一端的接头不含有barcode序列;双酶切RAD两端接头均含barcode序列;

(4)样品pooling和纯化;

(5)片段选择:单酶切RAD采用超声波随机打断后进行片段选择;双酶切RAD直接电泳切胶回收目标大小片段;

(6)PCR扩增富集片段:单酶切RAD加通用接头后用一端接头引物和通用接头引物PCR富集;双酶切RAD利用第三步接头引物PCR扩增富集;

(7)纯化PCR产物并对文库进行质控后测序(测序量参考下图2)。

由此可见,单双酶切RAD获得的测序片段是不一样的,单酶切RAD获得的片段是没有方向性的,只有带酶切位点一侧的read是对齐的,而双酶切RAD获得的片段具有方向性,两侧read均是对齐的。

图1 单/双酶切RAD测序片段比较(Brant et al. 2012)

图2 不同RAD测序量参考


3tag聚类

(1)数据质控

获得原始测序序列(Sequenced Reads)后,进行接头序列及polyN,polyA等序列的过滤,得到cleandata。

(2)barcode进行样本分类与RAD-tag聚类

数据经过质控后,利用barcode进行样本分类,去除PCR扩增引起的重复read后,再利用Stack软件的ustacks模块进行聚类组装,依据序列相似性进行tag聚类。


4变异鉴定

去除高读长深度(>500)的RAD-tags后,将双亲的RAD-tags进行BLAST比对分析。从比对结果中找出SNPs和真实InDel(≥2 bp),将这些变异在分离群体中进行比较。只有在亲本和群体中表现为一致多态的SNP才被保留下来。

对于单酶切RAD,将每个RAD-tag的另一侧的序列进行拼接得到contig,这些contig序列也可用于SNPs和InDel的鉴定。此外,如果contig的序列中含有SSR,还可用于PCR标记的开发。


5遗传图谱构建

利用卡方检验的方法检验所有标记在分离群体中的分离比,所有在群体中分离比符合单个位点遗传模式且缺失数据小于40%的标记都被用于遗传图谱构建。比如F2群体,符合1:2:1(纯合亲本1:杂合:纯合亲本2);RIL群体,符合1:1(纯合亲本1:纯合亲本2)。偏分离的标记中,根据目标物种相关文献信息,保留在群体中最小等位基因频率大于临界值的标记用于图谱构建。遗传图谱构建可采用软件Joinmap。


6基因/QTL定位

(1)质量性状基因定位

RAD测序较少用于质量性状基因的定位,建议提供F2群体以及F2:3家系的表型数据,这样可以确定F2单株目标性状的杂合基因型。将F2的表型数据看作一个标记和其余标记基因型数据一起输入Joinmap进行作图即可。但质量性状基因的定位推荐使用BSA的策略。

(2)QTL定位

RAD测序更多的应用在QTL定位。QTL的定位对群体表型数据的要求较高,群体要求F6代以上的重组自交系群体。通常群体中的每个家系最少需要两年两点数据,采用随机区组试验,每年每点的试验要有三个重复。如果重复较少,QTL定位结果非常不准确。目标性状最好要有较高的遗传率,且表型不易受环境条件的影响。根据目标群体的类型和标记数目,选择适合的QTL定位软件进行QTL定位。

图3 不同QTL作图软件的比较


7GWAS和群体进化

GWAS核心原理是通过对群体内每一个个体进行高通量基因分型,以群体中目标基因与其附近的标记之间的连锁不平衡为基础,检测每一个位点等位基因的频率和相应个体的表型变异之间的关系,分析关联显著性。在植物中,GWAS的研究对象一般为自然群体,包括野生种、地方品种和育种品种。也有利用多亲本构建的人工群体,比如NAM和MAGIC等。基于自然群体的GWAS,通常的优势在于:(1)使用自然群体,省去构建家系的花费。这对世代间隔长的物种(例如:林木)、繁殖力低的物种(例如:单胎动物)或者不适合人为干预创造群体的物种(例如:人)来说,这是非常重要的特性。(2)已经天然杂交多代,重组更加充分,定位精度更高。

利用RAD技术对收集到的自然群体进行测序,鉴定群体中存在的SNPs或InDel位点,然后对自然群体结构进行分析(包括主成分分析PCA,Structure和系统进化树),再根据群体中目标性状的表型数据,统计SNPs基因型和表型之间的相关性。对于没有参考基因组的物种来说,可以考虑参考已发表的遗传图谱,将分析得到的阳性SNPs在图谱上进行锚定,从而比较这些SNPs与已发表的目标性状相关SNPs之间的位置关系,发掘新的目标性状相关SNPs。

群体进化分析只能使用自然群体,而且对材料来源的地理分布要求要广,生态环境差异大,如果想研究物种演化,还需要野生种或祖先物种的材料。分析内容主要包括群体结构,群体多样性分析(亚群内和亚群之间),受选择位点的鉴定(高Fst值位点,群体分化系数),结合SNPs所在基因的注释信息与亚群的地理环境分布特点或人工选择的性状特点,对结果进行合理的解释。


今天的内容分享完啦,大家记得收藏好慢慢学习哦~


热门专题推荐


简化基因组测序( RRGS)简介 | RAD专题

不同RAD技术及其与GBS的比较  | RAD专题

无参RAD测序技术的应用  | RAD专题

无参RAD课题设计及SCI论文发表要求分类汇编  | RAD专题

BSA(集团分离分析法)简介

BSA相关知识——分子标记介绍

BSA相关知识——质量、数量性状和作图群体

BSA相关知识——基因 / QTL定位

BSA-seq性状定位技术流程 | BSA专题

BSA常见问题解析 | BSA专题

BMC Genomics | BSA快速鉴定菜豆抗炭疽病基因


您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存